K- 均值算法,又称 K-means ,是一种迭代求解的聚类分析算法。
• 算法目标:将训练样本划分成 k 个不同的簇(每个簇的中心采用 簇中所含值的均值𝜇),使得簇内样本尽可能相似。
算法流程: ① 确定簇个数 k (计划将数据划分为 k 个类); ② 随机确定 k 个初始点作为质心(在数据边界范围之内随机选取); ③ 对每个数据实例依次计算到 k 个质心的距离,选择最小距离的质心,并将其分配给该质心所对应的簇, 直到数据集中的所有数据全都分配给 k 个簇,更新 k 个簇的质心为该簇所有点的平均值; ④ 循环上述步骤③,重新分配每个数据实例到新的质心,直到达到终止条件,如所有数据的分配结果不再发生改变为止
以下是K均值算法的使用示例:
![]()
![]()
![]()
![]()
![]()
![]()
![]()